"""
    jieba是 Python中用于对中文进行分词的模块，它可以将一段中文文本分隔成中文词组序列。
    安装：pip install jieba
"""
import jieba

with open('我的文本.txt', 'r', encoding='utf-8') as file:
    s = file.read()

print(s)

# 分词
lst = jieba.lcut(s)

# 去重操作
set1 = set(lst)     # 使用集合实现去重
#
d = {}
for item in set1:
    if len(item) >= 2:
        d[item] = 0

# print(d)

for item in lst:
    if item in d:
        d[item] = d.get(item) + 1

# print(d)

new_lst = []
for item in d:
    new_lst.append([item, d[item]])

# print(new_lst)

# 列表排序
new_lst.sort(key=lambda x:x[1], reverse=True)
print(new_lst[0:11])    # 显示的是前10项

